Google DeepMind представляет Evo-Memory для LLM
DeepMind предлагает Evo-Memory для оптимизации стратегий через повторное использование опыта.
Найдено записей: 13
DeepMind предлагает Evo-Memory для оптимизации стратегий через повторное использование опыта.
OpenAI продвигается в создании ИИ с человеческим мышлением и креативностью, что подтверждается недавними успехами в конкурсах по программированию и математике и их исследованиями AGI.
Контекстный инжиниринг расширяет возможности больших языковых моделей, объединяя инновационные техники и системные архитектуры для решения актуальных исследовательских задач.
Alibaba представила Lumos-1 — унифицированную автогрессивную модель генерации видео, использующую MM-RoPE и AR-DF для эффективного моделирования пространственно-временных зависимостей с конкурентными результатами и эффективным обучением.
Mirage предлагает новый метод для моделей Vision-Language, позволяющий интегрировать визуальное мышление без генерации изображений, значительно повышая их эффективность в решении пространственных и мультимодальных задач.
MMSearch-R1 представляет собой систему обучения с подкреплением, которая позволяет большим мультимодальным моделям эффективно и избирательно выполнять поиск по запросу, улучшая точность и снижая нагрузку на систему поиска.
'ReasonFlux-PRM — новая траекторно-ориентированная модель награды, которая оценивает промежуточные шаги и финальные ответы в больших языковых моделях, значительно улучшая их способности к рассуждениям и результаты обучения.'
GURU представляет многоцелевой набор данных и модели обучения с подкреплением, значительно повышающие способности больших языковых моделей к рассуждению в шести различных областях и превосходящие предыдущие открытые модели.
Internal Coherence Maximization (ICM) представляет собой новый метод обучения больших языковых моделей без использования разметки, достигающий результатов, сопоставимых с обучением на данных с человеческой разметкой.
Исследователи Salesforce представили UAEval4RAG — новый бенчмарк для оценки способности RAG-систем отвергать неотвечаемые запросы разных типов, что повышает надежность ответов ИИ.
Исследователи Google представили LightLab — инновационный метод на основе диффузии, обеспечивающий точный и физически правдоподобный контроль освещения на одиночных изображениях, превосходящий существующие решения.
ByteDance представила Seed1.5-VL — мощную модель vision-language, которая достигает лучших результатов на многих бенчмарках и продвигает мульти-модальное понимание и рассуждение в ИИ.
'ZeroSearch от Alibaba обучает языковые модели поиску с помощью усиленного обучения и симулированных документов без использования дорогих API реального поиска, достигая результатов, сравнимых с Google Search.'